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摘 要 : 新 媒体 技术 压缩 时 空 ， 大 量 普通 民众 24 小 时 全 天 候 在 线 让 机 构 媒 体 疫 于 应 付 ，AI 主播 应 运 而 生 。 就 演变 历程 来 看 ， 
AI 主播 脱胎 于 传统 播音 员 ， 构 成 要 素 上 动漫 形象 居于 主要 位 置 ， 在 应 用 上 ， 首 次 发 端 于 游戏 娱乐 ， 再 是 信息 传播 ， 目 前 已 
扩展 至 电 商 直播 。 在 发 展 困境 上 ，AI 主 播 在 定位 、 链 接 以 及 人 格 化 方面 都 存在 一 定 的 问题 。 未 来 AI 主播 应 在 明确 目标 ， 完 
成 清晰 定位 ; 推动 应 用 ， 形 成 粉丝 社 群 ; 理 清 思路 ， 重 视 文化 创新 等 方面 发 力 ， 以 更 好 地 演进 发 展 。 
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技术 发 展 进步 改变 了 传统 媒介 生态 , 在 时 空 压缩 下 ， 
媒体 人 显得 力不从心 。 媒 介 生 态 的 改变 又 反 过 来 推动 技术 
应 用 ， 媒 体 领域 的 人 工 智 能 应 用 应 和 运 而 生 。AL 记 者 、AI 
编辑 、AI 主播 等 在 一 定 程 度 上 解放 了 媒体 工作 者 ， 相 较 
于 仅 作为 行业 内 部 工具 的 AI 记者 和 AI 编辑，AI 主播 因 
其 直接 出 场 、 具 有 一 定 的 人 格 化 色彩 ,， 广 受 关 注 。 当 前 ， 
媒体 发 展 已 进入 人 工 智能 时 代 ， 及 时 探讨 AI 主播 的 建构 、 
产生 的 困境 、 困 境 生成 的 原因 ， 对 找到 AI 主播 的 未 来 发 
展 之 路 具有 较 大 的 现实 意义 和 理论 意义 。 现 有 AI 主播 研 
究 多 关注 新 闻 媒体 这 一 应 用 场景 ， 以 游戏 娱乐 和 电 商 领域 
AI 主播 表现 为 参照 物 , 反思 新 闻 媒 体 领域 的 AI 主播 发 展 ， 
有 利于 探索 出 更 为 切实 可 行 的 媒体 AI 主播 发 展 路 径 。 
1. 演变 历程 

从 传统 播音 员 到 主播 、 网 络 主播 ， 主 播 的 工具 性 、 
功能 性 逐渐 淡化 ， 人格 化 色彩 增强 ， 然 而 从 网 络 主播 到 
AI 主播 的 演变 却 衍生 出 两 条 不 同 的 演化 路 径 : 媒体 领域 
的 人 格 化 缺失 和 游戏 电 商 领域 的 人 格 化 强化 。 理 清 两 者 
之 间 的 发 展 路 径 差 异 ， 对 整体 思考 当前 AI 主播 的 发 展 困 
境 以 及 未 来 出 路 具有 重要 作用 。 
1.1 概念 演变 历程 

从 历史 发 展 来 看 ， 主 播 概 念 并 非 瞬 间 形 成 ， 先 后 经 
历 了 播音 员 、 节 目 主 持 人 、 专 业主 播 、 虚 拟 主播 、 大 众 主 
播 以 及 如 今 的 AI 主播 等 几 个 阶段 。 中 华人 民 共 和 国 成 立 
后 ,广电 媒体 新 闻 节 目 主 要 采用 播音 员 制 ，1981 年 对 台 
广播 节目 《空中 之 友 》 首 次 出 现 “ 节 目 主 持 人 ”中 称呼 ， 
该 词 源 于 国外 ， 英 文 为 Host 或 Anchor， 具 体 何 时 传 入 国 
内 无 法 考证 。1981 年 后 随 着 电视 专题 节目 和 专栏 节目 的 
发 展 ， 主 持 人 力量 发 展 壮 大 、 各 具 特 色 ， 播 音 主持 开始 合 
而 为 一 ， 反映 在 大 学 专业 设置 上 就 是 形成 播音 主持 专业 。 
与 播音 员 不 同 ， 节 目 主持 人 主观 能 动 性 更 大 ， 不 仅 在 台 前 
播报 信息 、 表 达观 点 、 进 行 交 流 ， 而 且 往 往 深度 参与 到 节 
目的 制作 中 。20 世纪 90 年 代 媒 体 改革 催生 了 新 一 代 主 持 
人 ,记者 播音 .主持 三 者 合 而 为 一 ， 一 个 新 的 名 词 一 一 主 


播 ” 开 始 流行 。 互 联网 兴起 初期 ， 不 同 国家 开始 试 水 “ 虚 
拟 主播 ”， 其 后 虚拟 主播 在 游戏 和 动漫 领域 得 到 发 展 壮 
大 。 至 视频 直播 时 代 ， 随 着 游戏 、 教 育 、 商 业 和 社交 平台 
的 发 展 ， 各 大 平台 大 量 需 要 一 线 人 员 维护 用 户 黏 性 ， 网 络 
主播 应 运 而 生 ， 成 为 一 种 新 职业 。 至 此 ， 主 播 一 词 意义 高 
度 泛 化 ,不 仅 专 业 媒体 人 被 称 为 主播 ， 一 些 自 媒体 人 甚至 
是 活跃 于 直播 平台 上 的 普通 公众 也 被 称 为 主播 。2018 年 ， 
新 华 社 与 搜狗 联合 推出 全 球 首 个 AI 合成 主播 ， 通 过 人 脸 
关键 点 检测 、 层 语 识别 等 多 项 前 沿 技 术 生 成 与 真人 无 异 的 
AI 模 型 ,中 之 后 , 一些 媒体 平台 也 陆续 推出 自己 的 AI 主播 ， 
并 加 速 推 进 其 应 用 。 

1.2 构成 要 素 演进 

AI 主播 是 通过 模仿 真人 ， 参 与 到 信息 生产 、 商 业 运 
行 或 社会 交往 过 程 中 ， 起 到 主导 或 辅助 的 作用 。 目 前 Al 
主播 的 组 成 要 素 ， 可 从 形象 和 声音 两 个 层面 关注 ， 但 实 
际 两 者 背后 潜藏 的 则 是 人 格 和 情感 。 

就 形象 而 言 ， 目 前 主要 采用 两 种 方式 构建 AI 主播 的 
形象 ,一 是 真人 形象 ,如 新 华 社 以 印 浩 为 原型 的 “新 小 浩 ”、 
以 屈 萌 为 原型 的 “新 小 萌 ”、 以 赵 斑 微 为 原型 的 “新 小 
微 ”， 央 视 以 撒 贝 宁 为 原型 的 “小 小 撒 ” 等 。 这 类 形象 
往往 具有 较 大 的 知名 度 ， 拥 有 广泛 的 粉丝 群体 ， 从 事 的 
主持 任务 繁重 。 二 是 动漫 形象 , 这 类 形象 多 源 于 虚拟 社区 ， 
如 网 络 游戏 社区 和 网 络 社交 社区 。 较 为 知名 的 有 穿越 火 
线 的 “ 灵 狐 ”、B 站 的 虚拟 歌手 “ 洛 天 依 ”等 ， 早 期 多 
以 2D、3D 形象 示人 。 

就 声音 而 言 ， 真 人 形象 往往 直接 利用 技术 生成 语音 
库 ， 虚 拟 形象 或 利用 真人 配音 ， 或 建构 智能 语音 库 ， 或 
利用 技术 直接 合成 语音 。 

就 人 格 和 情感 来 看 ， 两 类 AI 主播 都 能 借用 部 分 人 格 
和 情感 ， 但 在 实际 的 使 用 过 程 中 ， 基 于 真人 形象 而 生成 
的 AI 主播 多 应 用 于 传统 播音 主持 领域 , 后 期 人 格 和 情感 
难以 维系 。 虚 拟 形 成 建构 的 AI 主播 则 因 其 与 社 群 相 连 ， 
借助 一 定 的 亚 文化 互动 和 “文本 资 猎 ”， 其 形象 和 情感 
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在 不 断 地 建构 和 生产 。 
1.3 应 用 场景 演进 

从 应 用 场景 来 看 ， 游 戏 娱乐 、 信 息 传播 以 及 电 商 运 
营 是 当前 AI 主播 发 展 较 好 的 领域 。 其 中 ， 游 戏 娱乐 提供 
了 形象 和 思路 ， 信 息 传播 提供 了 动力 ， 而 电 商 运营 则 提 
供 了 较为 丰富 的 应 用 接口 。 
1.3.1 游戏 娱乐 领域 : 提供 形象 

从 相似 性 来 看 ， 最 早 的 AI 主播 应 该 脱胎 于 网 络 游 
戏 。 游 戏 中 , 形象、 声音、 互动 以 及 任务 是 其 主要 元 素 ， 
其 中 最 吸引 人 的 地 方 在 于 任务 ， 其 次 形象 及 其 提供 的 活 
动 场景 是 人 们 的 主要 关注 点 。 在 互动 过 程 中 ， 人 们 往往 
将 游戏 中 的 主体 作为 自我 展现 和 表演 的 替代 者 ， 从 而 逐 
渐 对 形象 产生 情感 。 从 游戏 的 发 展演 变 历程 来 看 , 其 “从 
宣 能 性 的 游戏 到 象征 性 游戏 ， 再 到 规则 游戏 ， 它 逐渐 发 
展 为 典型 的 社会 性 活动 ， 生 发 出 越 来 越 复 杂 的 人 际 生 
态 ”。 中 也 正 是 因为 如 此 ， 游 戏 娱 乐 领域 的 AI 主播 往 
往 能 较 好 地 舱 入 人 们 的 日 常生 活 ， 也 较为 容易 地 为 人 们 
所 接触 ， 其 与 个 体 之 间 的 隔 头 也 较 小 。 
1.3.2 信息 传播 领域 : 看 重 语音 

在 新 闻 媒 体 领域 ， 随 着 社交 媒体 对 时 效 性 的 压迫 ， 
部 分 媒体 开始 开发 人 工 智能 信息 播报 员 ， 其 后 逐步 开发 
出 基于 真人 的 可 动 的 形象 ， 无 论 采 用 何 种 形象 ， 其 最 终 
目标 在 于 保证 24 小 时 实时 播报 新 闻 资讯 ， 从 而 将 人 类 主 
播 解放 出 来 。 从 新 华 社 AI 合成 主播 实践 来 看 ， 目 前 更 类 
似 于 “语音 播报 ”， 一 些 县 级 融 媒 体 中 心 采 用 的 AI 主播 
也 与 此 类 似 。 这 类 应 用 的 一 个 重要 特点 在 于 语音 优先 ， 
自动 生成 。 其 真人 面孔 更 多 地 体现 媒体 的 特色 ， 而 非 人 
格 化 ， 其 应 用 出 发 点 主要 在 于 工具 性 使 用 。 
1.3.3 电 商 直播 领域 : 着 眼 互 动 

在 电 商 领域 ， 由 于 直播 的 盛行 ， 人 人 交流 有 时 往往 
无 法 提供 海量 的 交往 可 能 性 ， 于 是 不 少 电 商 平台 引入 虚 
拟 主 播 ， 利 用 一 定 的 形象 ， 构 建 出 人 格 和 品牌 来 ， 从 而 
形成 虚拟 的 交流 。 它 们 与 游戏 娱乐 领域 AI 主播 类 似 ， 多 
以 虚拟 偶像 为 基本 形象 ， 利 用 其 中 的 情感 因素 或 亚 文化 
因素 获得 大 众 的 认可 ， 从 而 形成 购物 场景 ， 如 杭州 形象 
虚拟 主播 “ 白 素 素 ”、 基 于 了 站 虚拟 歌手 “ 洛 天 依 ” 生 
成 的 淘宝 主播 以 及 淘宝 虚拟 主播 “小 玉 ” 等 。 从 直播 效 
果 来 看 ， 其 直播 带 货 量 已 让 网 红 主 播 倍 感 压力 。 

在 日 常生 活 陪伴 领域 ， 也 产生 了 一 些 虚拟 主播 ， 不 
过 其 功能 更 多 体现 在 语音 交互 之 上 ,尚未 产生 情感 化 体验 。 
2. 发 展 困境 

保罗 。 莱 文 森 认为 技术 的 应 用 一 般 会 经 历 “ 玩 具 一 
镜子 一 艺术 ”三 个 阶段 ， 有 从 业者 认为 当前 AI 合成 主 
播 只 是 一 个 “玩具 ”, 外 也 有 学 者 认为 AI 主播 有 效率 优 
势 却 存 情感 劣势 。 巴 但 从 现实 来 看 ，AI 主播 在 各 个 领域 
的 发 展 困 境 略 有 差异 。 
2.1 定位 困境 : 陷入 工具 玩具 悖 论 之 中 

尽管 AI 主播 模仿 人 类 并 承担 部 分 人 类 功能 ， 但 在 现 


ChinaXiv 合 作 期 刊 


二 是 | ”” 


有 的 社会 语 境 中 , AL 主播 还 是 一 种 “ 物 ”, 是 一 种 被 观看 、 
被 消费 的 对 象 ， 是 一 种 被 人 们 使 用 的 工具 。 在 游戏 娱乐 
领域 ，AI 主播 被 当成 是 一 种 被 消费 的 对 象 ， 起 到 建构 和 
凝聚 社区 的 作用 ; 在 电 商 领域 和 新 闻 媒 体 领域 ，AI 主播 
被 当 作 信息 传播 的 工具 ， 从 而 使 得 “形象 ”丧失 作用 ， 
徒 留 声音 ， 而 单调 的 语音 传播 对 大 多 数 视听 无 障碍 者 略 
显 多 余 。 总 体 而 言 ，AI 主播 处 于 信息 、 商 品 产销 的 中 间 ， 
主导 者 的 首要 目标 是 想 使 其 成 为 承担 信息 生产 、 传 播 任 
务 的 工具 ， 而 消费 者 这 一 端 ， 人 们 对 其 接受 更 多 的 是 基 
于 猎奇 需要 和 娱乐 需要 ， 更 多 将 其 视 为 玩具 。 这 种 主导 
者 的 工具 心态 和 消费 者 的 玩具 心态 最 终 使 得 两 者 的 目标 
难以 调和 ， 形 成 怪 论 ， 影 响 AI 主播 的 接受 和 推广 。 
2.2 ”链接 困境 : 与 人 类 的 关系 过 于 单一 

无 论 如 何 变换 和 发 展 ，AI 主播 并 不 是 人 类 ， 这 点 考 
庸 置疑 。 这 就 产生 一 个 问题 : 如 何 让 作为 消费 者 的 个 体 与 
AI 主播 产生 链接 。 在 人 类 与 人 类 之 间 , 信息 、 知 识 、 经 验 、 
情感 、 观 点 、 兴 趣 、 社 会 关系 等 会 使 得 人 们 结合 在 一 起 ， 
而 AI 主播 与 人 类 的 链接 多 由 信息 完成 ， 这 就 导致 其 链接 
手段 过 于 单一 ， 影 响 交 往 和 使 用 的 持续 性 。 探 索 人 机 之 间 
广泛 的 关系 链接 、 兴 趣 链 接 、 情 感 链接 、 知 识 链接 和 算法 
链接 等 是 解决 链接 困境 的 主要 方式 。 当然, 摆脱 链接 困境 ， 
使 之 成 为 人 与 人 交往 中 介 也 不 失 为 一 种 策略 。 
2.3 人格 困境 : 技术 难以 完成 类 人 目标 

AI 主播 人 格 包括 两 个 层面 : 一 是 类 人 层面 ， 这 点 目 
前 的 AI 合成 主播 在 形象 和 声音 方面 基本 达到 ， 但 在 情感 
和 观点 展现 上 则 相差 甚 远 ; 另 一 个 层面 是 个 性 化 层面 ， 
即 不 仅 拥 有 解决 问题 的 能 力 和 智慧 ， 而 且 形 成 自己 独特 
的 个 性 ， 这 点 即便 在 人 类 当中 也 属于 较 高 要 求 。 从 现 有 
技术 发 展 路 径 和 技术 能 力 来 看 ，AI 主播 人 格 化 离 此 还 有 
相当 长 的 路 要 走 。 不 过 上 述 人 格 困境 都 是 从 单 向 大 众 传 
播 的 视角 展开 ， 一 且 AI 主播 进入 到 人 际 交 往 层 面 或 者 社 
群 交 往 层 面 ， 其 人 格 化 便 可 能 被 赋予 出 来 ， 但 此 点 显然 
不 在 AI 主播 设计 层面 ， 而 是 在 应 用 层面 。 
3. 未 来 出 路 

AI 主播 面临 的 发 展 困境 是 多 元 的 ， 既 有 因 定 位 而 产 
生 的 困境 ， 也 有 因 与 人 类 间 的 关系 而 产生 的 困境 ， 还 有 
因 技 术 原 因而 产生 的 发 展 困 境 。 相 对 而 言 ，AI 主播 的 应 
用 广泛 ， 应 用 领域 存在 差异 ,技术 也 有 难以 超越 之 处 ， 
因此 在 理解 这 些 困 境 的 基础 上 ， 明 确 目 标 、 关 注 应 用 和 
理 清 发 展 思路 更 显 重 要 。 
3.1 明确 目标 ， 完 成 清晰 定位 

当前 AI 主播 的 目标 既 有 信息 传播 目标 ， 亦 有 互动 区 
流 目标 ， 还 有 作为 社区 凝聚 者 的 目标 。 就 目前 的 技术 手 
段 来 看 ， 完 全 满足 所 有 目标 还 有 一 定 的 难度 ， 因 此 将 目 
标 细 化 、 简 单 化 ， 不 失 为 一 种 出 路 。 如 新 闻 媒 体 和 电 商 
直播 领域 ， 关 注 AI 主播 的 语音 问题 ， 利 用 大 数据 构建 知 
识 和 信息 服务 体系 的 问题 ， 而 非 简单 地 以 人 格 化 主持 人 
为 目标 。 在 游戏 和 娱乐 领域 ， 则 需要 关注 其 作为 偶像 的 
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主题 和 互动 功能 ， 着 力 发 展 其 作为 “文本 资 猎 ” 对 象 的 
塑造 ， 以 形成 中 心地 位 。 
3.2 推动 应 用 ， 形 成 粉丝 社 群 

人 格 化 包括 技术 人 格 化 、 用 户 参 与 人 格 化 、 场 景 使 
用 人 格 以 及 人 格外 构 。m 技术 人 格 化 是 技术 赋予 AI 主播 
的 个 性 化 特征 ; 用 户 参 与 人 格 化 是 由 用 户 自己 生成 意义 
和 价值 ; 而 场景 使 用 人 格 化 则 是 基于 特定 场景 而 形成 的 
价值 依赖 。 从 当前 技术 发 展现 状 和 路 径 来 看 ，AI 主播 的 
人 格 化 不 可 能 通过 技术 获得 ， 因 此 必须 另辟蹊径 。 但 这 
种 人 格 并 非 技术 所 赋予 ， 而 是 由 参与 者 和 使 用 者 赋予 。 
这 里 就 需要 关注 不 同 阶层 、 不 同 群体 的 接受 差异 ， 将 如 
乐 性 接受 、 猎奇 性 接受 变 成 偶像 型 接受 , 形成 亚 文化 社 群 ， 
同时 推动 “新 旧 媒 体 间 迁移 、 内 容 迁 移 以 及 群体 行为 和 
文化 生态 迁移 ””"、 以 便 接受 。 
3.3 理 清 思路 ， 重 视 文化 创新 

从 技术 应 用 阶段 来 看 ， 早 期 应 用 多 以 “玩具 ”视角 
展开 ， 其 后 迅速 向 “工具 ”阶段 展开 ， 而 最 终 的 应 用 一 定 
与 “文化 ”相关 ， 进入 到 人 们 的 日 常生 活 当 中 。 从 AI 主 
播 的 构成 要 素来 看 ， 形 象 和 人 格 是 产生 文化 、 介 入 日 常生 
活 的 主要 要 素 ， 而 声音 则 是 工具 性 要 素 。 因 此 ，AI 主播 
的 未 来 应 用 应 着 重 关 注 其 形象 层面 ， 包 括 文化 形象 、 传 播 
形象 、 交 往 对 象 等 , 关注 其 对 社 群 文化 和 价值 观念 的 塑造 ， 
推动 粉丝 社 群 的 形成 ， 最 终 方 能 赋予 其 人 格 化 色彩 。 了 加 
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